PromptEcho: Recompensa sin anotaciones de modelos visión-lenguaje para aprendizaje por refuerzo texto-imagen
Recompensa sin anotaciones para aprendizaje por refuerzo, una herramienta efectiva para potenciar el proceso de aprendizaje de forma visual. Encuentra la combinación perfecta entre texto e imagen.